Centros o periferias: selección de datos vía centralidad de grafo web
Descubre cómo WebGraphMix selecciona datos de preentrenamiento usando centralidad de grafo web, mejorando el rendimiento de modelos de lenguaje sin necesidad de etiquetado.
Descubre cómo WebGraphMix selecciona datos de preentrenamiento usando centralidad de grafo web, mejorando el rendimiento de modelos de lenguaje sin necesidad de etiquetado.
Descubre cómo WebGraphMix selecciona datos de preentrenamiento para IA usando la centralidad de la web, mejorando rendimiento sin etiquetas. 🔥
CVS selecciona datos de alta calidad para SFT multimodal sin entrenamiento. Mejora un 3.5% usando solo el 10% de los datos y reduce costos un 44%.
Descubre CVS: método sin entrenamiento para seleccionar datos de SFT visión-lenguaje, mejorando rendimiento un 4.8% con solo 15% de datos.
Descubre cómo unificar la eficiencia en datos, memoria y cómputo para entrenar LLMs de forma óptima bajo presupuestos limitados. Aprende técnicas clave.
Descubre GRASP, un método innovador que modela interacciones entre subconjuntos para optimizar la atribución de datos en preentrenamiento a gran escala. Mejora eficiencia y precisión.
Agentes generalistas automatizan la curación de datos: nuevo benchmark Curation-Bench muestra que superan métodos publicados con 10% del presupuesto.
Descubre STRIDE, un nuevo método que atribuye predicciones de LLM a datos de entrenamiento mediante recuperación dispersa, logrando 13 veces más rapidez que métodos anteriores.
Descubre cómo PivotTrace logra un rendimiento casi total con solo el 29% de datos etiquetados y una convergencia 2.75 veces más rápida en RLVR.
Descubre TSQAgent, un marco de agentes de IA que evalúa la calidad de series temporales mediante razonamiento y herramientas analíticas. Mejora la selección de datos y el rendimiento.
BLISS: método ligero para selección de datos en preentrenamiento de LLMs. Logra 1.7x de aceleración sin modelos externos.
Aprende cómo las funciones de confianza filtran etiquetas débiles para lograr generalización casi sin pérdidas. Mejora tu IA.
La selección de datos sintéticos con meta-redes tiene desafíos. Descubre cómo aumentar el tamaño de lote y usar características informativas mejora el rendimiento en un 5.49%.
Descubre cómo un nuevo enfoque unifica y optimiza la valoración de datos usando decisiones secuenciales, mejorando la selección en LLM y benchmarks clásicos.
Descubre PRISM, un método que selecciona datos de instrucción visual sin entrenamiento, reduciendo costes y mejorando el rendimiento de modelos multimodales.
Descubre cómo la selección miope de datos en el fine-tuning de LLM puede perjudicar la adaptabilidad futura y cómo evitarlo.